第五章 数据分类

填空题

1.分类的过程包含:获取数据、预处理、分类器设计和分类决策。(guo)
2.分类器设计阶段包含三个过程:划分数据集、分类器构造和分类器测试。(guo)(另)
3.分类问题中常用的评价准则有:精确度、查全率和查准率、F-measure 和几何均值。(guo,三个空就行)(另)
4.支持向量机中常用的核函数有:多项式核函数,径向基核函数和 S 型核函数。(guo)(另)

简答题

5.什么是分类?分类的应用领域有哪些?(guo)(另)

答:
分类是指把数据样本映射到一个事先定义的类中的学习过程,即给定一组输入的属性向量及其对应的类,用基于归纳的学习算法得出分类。
分类问题是数据挖掘领域中研究和应用最为广泛的技术之一,许多分类算法被包含在统计分析工具的软件包中,作为专门的分类工具来使用。分类问题在商业、银行业、医疗诊断、生物学、文本挖掘、因特网筛选等领域都有广泛应用。例如,在银行业中,分类方法可以辅助工作人员将正常信用卡用户和欺诈信用卡用户进行分类,从而采取有效措施减小银行的损失;在医疗诊断中,分类方法可以帮助医疗人员将正常细胞和癌变细胞进行分类,从而及时制定救治方案,挽救病人的生命;在因特网筛选中,分类方法可以协助网络工作人员将正常邮件和垃圾邮件进行分类,从而制定有效的垃圾邮件过滤机制,防止垃圾邮件干扰人们的正常生活。